Is Interpretation Differences of Radiologists an Important 


Issue in Breast Imaging Reporting and Data System? 


Radyologlar ve BI-RADS Kategorileme Sistemi / Radiologists and BI-RADS Categorization System 


Eda Parlak', Cemil Giirses', Mustafa Yildirim’, Arsenal Sezgin Alikanoglu*, Ebru Ozan', Aysegiil Kargi?, Mert Kéroglu' 
'Radyoloji Klinigi, 7Tibbi Onkoloji Klinigi, 7Patoloji Klinigi, Antalya Egitim ve Arastirma Hastanesi, Antalya, Tiirkiye 


Ozet 

Amag: Calismamizin amac! Meme Gértnttileme Raporlama ve Veri Sisteminin 
radyologlar arasinda kullaniminda uyumu arastirmak, olusan farkliliklarin ne- 
denlerini ve bu farkliliklarin en cok hangi kategorilerde gerceklestiginin belir- 
lemektir. Gereg ve Yéntem: Tarama amacli mamografi cekilen 773 hastanin 
mamografileri 2 radyolog tarafindan retrospektif ve birbirlerinden bagim- 
siz olarak degerlendirildi. Tum sonuclar Meme Goriintiileme Raporlama ve 
Veri Sistemine gére degerlendirildi. Kategori 1, 2 ve 3 benign, kategori 4 ve 
5 ise malignite stipheli lezyonlar ile uyumlu olarak degerlendirildi. Gozlemci- 
lerin benign ve malign lezyonlar aras! uyumu ve tim kategoriler arasi uyumu 
Kappa testi ile arastirildi. Bulgular: Calismaya alinan 773 hastanin 554’iinde 
her iki radyolog ayni kategoriyi raporlarken kalan 219 hastada farkli katego- 
riler raporlanmistir. Her iki gozlemci arasindaki uyumu arastirmak igin kul- 
lanilan Kappa testinin degeri istatiksel olarak anlamli bulundu (p=0,001) ve 
0.602 degeri orta derecede uyum olarak degerlendirildi. Meme Gortinttileme 
Raporlama ve Veri Sistemi skoruna gore benign ve malign riskte degerlendi- 
rilen hastalarin mamografileri arasindaki uyum arastirildiginda benign olgu- 
lar kategori 1, 2, 3 olarak kabul edilirken, kategori 4 ve 5 ise malignite siiphe- 
li lezyonlar olarak degerlendirilmistir. Benign ve malign olgular arasinda Kap- 
pa testinin degeri istatiksel olarak anlamli bulundu (p=0,001) ve 0.857 ile mui- 
kemmel derecede uyum olarak degerlendirildi. Her iki gézlemci arasinda ka- 
tegori 5 lezyonlar arasinda mutlak uyum var iken en cok fark kategori 3 lez- 
yonlarda saptandi. Tartisma: Meme Gortintiileme Raporlama ve Veri Siste- 
mi terminolojisi memede saptanan lezyonlarin siniflanmasi, arada olusan ka- 
risikliklarin 6nlenmesi ve klinisyenlerin lezyonlara yaklasimlari agisindan or- 
tak bir dil olusturmay! ama¢lamaktadir. istenilen diizeyde olmasa da mamog- 
rafi raporlamasinda belli bir standardizasyon saglanmistir. Ancak yorumcu- 
lar arasi olusan uyumsuzluk Meme Gortintiileme Raporlama ve Veri Sistemi- 
nin yapilan calismalar ve goriisler dogrultusunda belirli araliklarla giincellen- 
mesi gerektigini géstermektedir. 
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Abstract 

Aim:The aim of our study is to search the reproducibility of the radiologists 
using Breast Imaging Reporting and Data System, to determine the reasons 
of differences in interpretation and find out in which categories inerterpreta- 
tion differences occur mostly. Material and Method: Screening mammograms 
of 773 patients were evaluated retrospectively and independently by 2 radi- 
ologists. All results were evaluated according to the Breast Imaging Report- 
ing and Data System. Category 1, 2, 3 were accepted as benign, category 4 
and 5 were considered as “lesions suspicios for malignancy”. Consistency of 
the radiologists in benign and malign lesions and also in all categories, was 
statistically examined by Kappa test. Results: Of the 773 patients of the 
study 554 were categorized identically by the 2 radiologists whereas 219 
patients were categorized differently. Kappa value calculated to determine 
the consistency between the 2 radiologists was found statistically signifi- 
cant (p<0,001) and the value 0,602 was considered as moderate consistency. 
When consistency between mammographies of patients categorized as 
benign and with malignancy risk according to the Breast Imaging Report- 
ing and Data System score is examined , benign cases were considered as 
category 1,2, 3 and lesions suspicious for malignancy were considered as 
category 4,5. Kappa value between benign and malignant cases was found 
statistically significant.(p<0,001) and the value of 0.857 was considered as 
excellent consistency. Absolute consistency was determined between the 2 
radiologists in category 5 lesions whereas the most significant difference 
was observed in category 3 lesions. Discussion: Breast Imaging Reporting 
and Data System terminology aims to classify the lesions of breast and to 
prevent confusions in classification as well as to determine a common ap- 
proach to the lesions by the clinicians.. Although not in the desired level yet, a 
standardization has been established in reporting mammographies. But the 
inconsistency between the interpreters suggest that a periodic update in the 
Breast Imaging Reporting and Data System according to recent studies and 
opinions, is neccessary. 


Keywords 
Mammography; Breast; Radiologist 


DOI: 10.4328/JCAM.1059 


Received: 02.05.2012 Accepted: 29.05.2012 Printed: 01.07.2013 


J Clin Anal Med 2013;4(4): 307-9 


Corresponding Author: Mustafa Yildirim, Antalya Egitim ve Arastirma Hastanesi, Tibbi Onkoloji Klinigi, Varlik Mah. Kazim Karabekir Cad. Soguksu, 07050 
Antalya, Tiirkiye. GSM.: +905333948252 F.: +90 2422494402 E-Mail: mustafayildirim7 @yahoo.com 


Journal of Clinical and Analytical Medicine | 307 


Radyologlar ve BI-RADS Kategorileme Sistemi / Radiologists and BI-RADS Categorization System 


Giris 

Meme kanseri, kadinlarda en sik rastlanan ve akciger kanserin- 
den sonra en cok dliimle sonuclanan kanser tipidir [1]. Meme 
kanseri taramasindaki en 6nemli gériintileme yontemi mamog- 
rafidir. Bu y6ntemle birlikte ve tamamlayici olarak ultrason ve 
manyetik rezonans gortintiileme gibi ek yOntemler de kullanil- 
maktadir [2]. Tim lezyonlarin ortak bir dilde anlatilabilmesi, kli- 
nisyenlerin bir sonraki asamada neler yapabileceklerinin daha 
net bir dille anlayabilmeleri, mamografik bulgulardaki karisik- 
liklarin 6nlenmesi icin mamografide standart bir raporlama sis- 
temine ihtiyag duyulmustur. Bu nedenle 1993 yilinda Amerikan 
College of Radiology (ACR) tarafindan ‘Meme Gortntiileme Ra- 
porlama ve Veri Sistemi’ (BI-RADS) adi verilen bir raporlama sis- 
temi standardize edilmisti [3;4]. BI-RADS ilk yayinlandigindan 
itibaren dort kez guncellenmistir. Bu nedenle de BI-RADS’In sen- 
sitivite, spesifite, ve prediktif degerleri hakkinda pek cok calis- 
ma yapilmistir. Ancak yorumcular arasindaki uyum hakkinda az 
sayida ¢alisma bulunmaktadir [5]. 

Calismamizin amaci; ayn! mamografiler i¢gin farkli radyologlarin 
BI-RADS sonuclarini karsilastirmak, ne kadar farklilik veya uyum 
oldugunu belirlemek ve ozellikle bu sonuclarin BI-RADS kategori 
4, 5 lezyonlardaki sonuclarini arastirmaktir. Boylece BI-RADS’in 
gercek amacina ulasabilme oranini bir kez daha ortaya koymak- 
tir. 


Gere¢ ve Yéntem 

Calismaya Antalya Kanser Erken Teshis, Tarama ve Egitim Mer- 
kezine Ocak 2011-Mart 2012 yillar! arasinda meme kanseri ta- 
ramasi amaciyla basvuran hastalar alindi. Mamografiler ayni 
nitede galisan ikisi de mamografi alaninda deneyimli iki ayri 
radyolog tarafindan degerlendirildi. Degerlendirmeler degisik 
zamanlarda ve birbirlerinden bagimsiz olarak BI-RADS kriterle- 
rine gore yapildi. Hastalarin demografik bilgileri anket sorulari 
araciligi ile sorgulandi. Mamografisi iki ayri radyolog tarafindan 
degerlendirilmeyen hastalar ¢alismaya alinmadi. 

Mamografi gortntiileri GE Senographe DMR cihazi ile alindi. 
Tim goruntiler rutin olarak kraniokaudal ve mediolateral oblik 
projeksiyonlarda cekildi. Mamografik gériintilerde single emul- 
siyon 18x24 cm filmler veya biiyUk memelerde 24x30 cmllik 
filmler kullanildi. 

Her iki radyolog da filmleri BI-RADS kategorileme sistemine 
gore raporladi. BI-RADS kategorileme sistemine gore; Kategori 
O: ek tetkik gerektirenler, 1: negatif mamografi (rutin goriinti- 
leme), 2: benign bulgular (rutin gériintileme), 3: biiyiik olasilikla 
benign (kisa araliklarla takip (6ay), 4: sipheli anormallikler (bi- 
yopsi yapilmasi distinulmeli), 5: malign olma olasiligi ¢ok yiksek 
lezyonlar (gerekli islemler yapilmali) [6]. 

istatiksel analizler SPSS 15.0 kullanilarak yapildi. iki radyolofun 
BI-RADS skorlar! arasindaki uyumu Cohen Kappa istatistik tes- 
ti ile arastirildi. Cohen Kappa istatistik testi iki veya daha fazla 
gozlem arasindaki kalitatif uyum oranini (k: Kappa) olg¢mek icin 
gelistirilmis bir testtir. Tam uyum olmasi icin k degerinin 1 ol- 
masi gerekir. K degeri O oldugunda beklenilen oran sansa bag- 
lidir. K degeri negatif oldugunda beklenilen uyum sans ihtima- 
linden bile disuktir. Mutlak bir ayrim bulunmamasina ragmen , 
daha once yayinlanmis makalelerde gézlemciler arasinda uyumu 
belirten k degeri araliklari soyledir; k< 0,20 ise 6nemsiz uyum, 
k: 0,21-0,40 ise minimal uyum, k: 0,41-0,60 ise orta derecede 


uyum, k: 0,61-0,80 ise 6nemli derecede uyum, k: 0,81-1,00 ise 
gozlemciler aras! miikemmel uyum oldugunu gosterir [7]. 


Bulgular 

Calismaya 773 hasta alindi. Hastalarin yas ortalamasi 57.9+4.9 
(51-70 yas) olarak saptandi. Hastalarin ilk menars yas ortala- 
mas! 13,9+1.56 (11-20 yas), menopoz yas ortalamasi 45,649.47 
(30-57 yas), ilk dogum yas ortalamas! 20.7+4.7 (15-44 yas) ola- 
rak saptandi. 

Anket uygulanmasini kabul eden 211 hastanin; sigara kullani- 
mi sorgulandiginda 4’Uniin (%1.9) daha Once sigara kullandi- 
81, 13’Untin (%6.1) halen sigara kullandigi, 194’tintin (%92) si- 
gara kullanmadigi tespit edildi. Canli doSum sayis! medyan 3 
(0-9), gebelik sayis! medyani 4 (0-14) olarak bulundu. Oral kont- 
raseptif kullanimi 44 (%20.8) hastada, hormon replasman te- 
davisi kullanimi 21 hastada (%9.9) idi. Ailesinde meme kanse- 
ri oykiist 12 hastada (%5.7), jinekolojik kanser 6ykUsti 2 hasta- 
da mevcuttu. 

Ayni kategoriyi 773 hastanin 554’tinde her iki radyolog rapor- 
larken, kalan 219 hastada farkli kategoriler raporlanmistir. Her 
iki radyolog tarafindan stipheli olarak kabul edilen kategori 4 ve 
5 lezyonlarin sayisi birinci g6zlemci igin 12, ikinci gdzlemci i¢in 
14 idi. Her iki gézlemci tarafindan ayni 3 hasta kategori 5 ola- 
rak degerlendirildi. Bu hastalardan 2’si invaziv duktal karsinom, 
1’i ise musinéz karsinom tanisi aldi. 

Her iki radyolog arasindaki uyumu arastirmak igin kullanilan Kap- 
pa testinin degeri istatiksel olarak anlamli bulundu. (p=0,001) ve 
0.602 degeri orta derecede uyum olarak degerlendirildi. BIRADS 
skoruna gore benign ve malign riskte degerlendirilen hastalarin 
mamografileri arasindaki uyum arastirilirken benign olgular ka- 
tegori 1, 2, 3 olarak kabul edilirken, kategori 4 ve 5 ise maligni- 
te supheli olarak degerlendirilmistir . Benign malign olgular ara- 
si yapilan Kappa testinin degeri yine istatistiksel olarak anlam- 
It bulundu (p=0,001) ve 0.857 ile miikemmel derecede uyum ola- 
rak degerlendirildi. (Tablo 1) 

Her iki radyologun BI-RADS sonuclari acisindan en farkli sonug- 
lar kategori 3 de elde edildi. Her iki radyologda ayni sayida ka- 
tegori 5 lezyon tanimladi. Yani en cok uyum kategori 5 lezyon- 
larda saptandi. Her iki radyolog tarafindan ortak 6 olguya kate- 
gori 4 tanisi konmustur. Ancak kategori 4 olgularda iki radyolog 
arasinda az sayida da olsa fark saptanmistir. 


Tablo 1. Her iki radyologa gére BIRADS skorlari 


BIRADS RADYOLOG C RADYOLOG E 

0) 108 (%14) 114 (%14.7) 

1 230 (%29.7) 284 (%36.7) 

2 341 (%44.1) 327 (%42.3) 

3 83 (%10.7) 34 (%4.4) 

4 9 (%1.2) 11 (%1.4) 

5 3 (%0.4) 3 (0.4) 
Tartisma 


Mamografi erken evre meme kanseri saptanmasinda tarama- 
larda kullanilan en etkin yontemdir. Ozellikle meme kanserinin 
erken saptanmasinda en duyarli bulgu olan mikrokalsifikasyon- 
larin saptanmasinda dogrulugu en yiiksek yontemdir [8]. Bu ne- 
denle mamografide kullanilan ve klinisyene lezyon hakkindaki 
bilgilendirmeyi yapacak olan terminoloji ¢ok 6nemlidir. Termi- 
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nolojinin ortak olmasi ve klinisyenin bir sonraki asamaya daha 
iyi karar verebilmesi icin tim radyologlara ve klinisyenlere yol 
gésterici olan BI-RADS kategorileme sistemi olusturulmustur. 
Bu zamana kadar BI-RADS ve uygulanisi konusunda pek cok ¢a- 
lisma yapilmistir. Lehman ve arkadaslarinin [9] oldukga genis 
bir seride ve uzun sireli yaptiklar! calismada 6nceki ¢alismalara 
oranla BI-RADS kategorileme sistemi ve lezyonlar arasinda git- 
tikge artan bir uyum saptamislardir. Bu da giinimiizde BI-RADS 
kategorileme sisteminin kullaniminin yayginlasmasini acikla- 
maktadir. 

Birgok arastirmaci tarafindan BI-RADS terminolojisinin kullani- 
minda radyologlar arasi uyum oranlari test edilmistir [6;7]. Ca- 
lismalarda genellikle karsilastirmalarda radyolog sayisi fazla 
ancak hasta sayilari az olarak incelenmistir. Bizim ¢alismamiz- 
da bu ¢alismalardan farkli olarak kalabalik bir hasta grubunda 
iki radyolog arasindaki uyum arastirilmistir. Benign olarak kabul 
edilen BI-RADS 2 ve malignite olasilig1 en yiiksek olan BI-RADS 
5 lezyonlarda uyum en yiiksek iken BIRADS 3 ve 4 lezyonlar- 
da uyum orani daha dustk olarak saptanmistir. Hatta BI-RADS 
5 lezyonlarda uyum en yiiksek oranda bulunmustur. Ciatto ve 
arkadaslarinin [4] 50 vaka ve 12 radyolog arasinda yaptiklari 
bir calismada da benzer oranlar saptanmistir Bizim ¢alismamiz- 
da kanserli olgularin iki radyolog arasindaki uyumu, kanserli ol- 
mayan olgulardan daha iyiydi ancak Kerlikowske ve arkadasla- 
rinin [10] yaptig! benzer bir ¢alismada bu uyum kanserli olma- 
yan normal mamografili olgularda daha belirgin bulunmustur. 
Bunun nedeni BI-RADS kategorileme sisteminde malignite y6- 
nunden supheli olgulara ek tetkik gerektiren olgu, yiiksek olasi- 
likla malign veya biyopsi gerektiren olgular seklinde degisik yak- 
lasimlar yapilabilmesi ve bunun da maligniteleri kategorileme- 
de cesitlilik olusturdugunu belirtmisler. Ancak bizim ¢alismamiz- 
da iki radyologun uyumu arastirildigi icin ve radyolog sayisi di- 
ger calismalara gore daha az oldugundan malignitelerin uyu- 
mu daha fazla olarak saptanmistir. Bu durumda BI-RADS kate- 
gorileme sisteminde maligniteler veya ylksek olasilikla maligni- 
teler konusunda radyologlar arasinda ortak bir dil olusabildigi- 
nin gostergesidir. 

Bizim galismamizin bir kisitliligininda kategori 4 lezyonlari daha 
alt siniflara (4a, 4b, 4c) ayirararak incelememekten kaynaklan- 
digini diisdniiyoruz. Cunkti bu siniflamay: kullanmak benign gé- 
runtime daha yakin ancak arada kalinan kategori 4 olgularda ka- 
tegori 3 yerine kategori 4a kullanilarak uyumun daha da yiiksek 
cikmasina neden olabilirdi. Bu konu ile ilgili Lazarus ve ark. ultra- 
sonda kategori 4a, 4b, 4c’yi kullanarak yaptiklar! ¢alismada rad- 
yologlar arasinda kappa degerleri oldukc¢a yiiksek bulunmus ve 
kategori 4’U subgruplara ayirmanin gereksiz biyopsileride 6onle- 
digini bildirmislerdir [11]. 

BI-RADS tiim diinyada standart bir kategorileme sistemi iken 
kategori 4 radyologlarin ve klinisyenlerin kafasinda soru isaret- 
leri olusturmaktadir. Bizim ¢alismamizda ise iki radyologun or- 
tak karari kategori 4 olan 8 olgunun 1’i malign olarak saptan- 
di. Bu sonucta diger ¢alismalarla oldukga uyumlu bulunmustur. 
Kategori 4 olgular aras! uyumsuzlugun nedeninin ise radyolo- 
gun bilgi ve deneyiminden cok diger etkenlere baglidir. Bunlarin 
iginde en 6nemlisi meme dansitesidir. Mamografinin duyarliligi 
skleroze veya liposkleroze memelerde azalmaktadir. Bu durum 
lezyon tanimlamalarinda ve BIRADS kategorilemelerinde farkli- 
liklara neden olmaktadir. Radyologlar arasinda meme dansitesi- 


ne yonelik BIRADS ile ilgili yapilan bazi calismalarda uyumun ol- 
dukga yiiksek oldugu saptanmistir [12;13]. 

Daha once yapilan ve lezyonlarin morfolojik 6zellikleri, mikrokal- 
sifikasyon gorunimleri veya kitlelerin degisik goriinme sekilleri 
ile ilgili yapilan galismalarda radyologlar arasi uyumun BI-RADS 
ile yapilan calismalarda saptanan uyumdan ¢ok daha az oldu- 
gu bildirilmistir [4;7]. Bu da BI-RADS’in radyologlar arasinda or- 
tak bir dil olusturma konusunda ne kadar basarili oldugunu gés- 
termektedir. 

Sonug olarak BI-RADS kategorileme sistemi mamografi rapor- 
larint standardize etmek, mamografi yorumlarinda karisikligi 
onlemek, sonuclarin yol géstericiliZini kolaylastirmak ve ortak 
bir terminoloji olusturmak amaciyla gelistirilmistir ve bu konu- 
da da oldukga uzun bir yol katetmis durumdadir. Ancak yorum- 
cular arasi olusan uyumsuzluk bize bu konuda yapilan ¢alismala- 
rin gerekliligini ve BI-RADS kategorileme sisteminin bu gortsler 
dogrultusunda belirli araliklarla giincellenmesi gerektigini gés- 
termektedir. 
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